机译:在半岛决策过程中使用其模型的海洋发电厂系统运行过程的决策控制问题
机译:首次通过标准的半马尔可夫决策过程的均方差最优
机译:初次通过条件下半马尔可夫决策过程的均值方差最优
机译:基于半马尔可夫决策过程的多处理器多无线电节点的最优资源控制
机译:半马尔可夫决策过程的固定探索新强化学习算法
机译:学习最大化奖励率:基于半马尔可夫决策过程的模型
机译:吸收具有多个约束的半马尔可夫决策过程的后悔最优策略(信息和决策过程的发展)
机译:无界成本半马尔可夫决策过程理论及其在排队系统最优控制中的应用。